데이터시각화
HW3
1. 문제 제기
다양한 언론을 통해 우리는 여전히 수많은 교통사고
일어나고 있다는 것을 있습니다. 이런 많은
교통사고 소식을 듣게 되면, 교통 사고가 자주 일어나
지역이 따로 있다는 생각을 가지게 합니다. 과연
교통사고와 특정 지역 간에 연관이 있는지 알아보고
교통사고가 많이 발생하는 지역이 있다면 지역이
어떤 특징을 가지고 있는지 알아보려고 합니다.
출처: https://news.joins.com/article/23552254
2. 가설 설정
지금 가지고 있는 교통사고 공공데이터와 앞에 제기했던 문제를 활용해 2가지 가설을 세우고 가설이 맞는지 확인해보겠습니다.
1. 교통사고 유형에 상관없이 교통사고가 많이 일어나는 지역이 존재하고, 지역은 교통사고가 일어나기 쉬운 위험지점이
것이다.
2. 노인, 무단횡단, 어린이, 자전거로 분류를 나누어 유형별 교통사고가 많이 일어나는 지역이 있을 것이다.
3. 데이터 전처리
3. 데이터 전처리
Trafficmap.csv
4. How to solve the problems with visualization
교통사고 데이터의 범위를 서울 내로 제한하고 사고유형구분
으로 나누어서 분류하였습니다.
*지도를 사용하는데 Mapbox 사용하였는데, csv파일로 이용
하게 되면, 데이터 사용 수가 제한돼있어서 직접 csv파일 안에
있는 필터로 개수를 보며 나누어주었습니다.
4. How to solve the problems with visualization
Trafficmap.csv에서 서울에서 일어난 교통사고
데이터만 뽑아 trafficmap_seoul.csv 만들었습
니다.
trafficmap_seoul.csv에서 사고유형별로 나누어 4가지
traffic_데이터를 만들었습니다.
*뒤에 붙어 있는 숫자는 교통사고 발생년도 범위입니다.
4. How to solve the problems with visualization
Mapbox simple code 받고 csv파일 안에 있는 데이터를 전달해주기 위해서 csv
일에서 geoJSON파일로 변환해줍니다.
*파일 변환 사이트: http://www.convertcsv.com/csv-to-geojson.htm
geoJSON파일 형식입니다.
4. How to solve the problems with visualization
무단횡단으로 인한 교통사고 발생
지역과 발생 수를 보게 되면 종로 ,
가산 디지털 단지 쪽에 조금
교통사고가 일어나고 있음을
있습니다.
4. How to solve the problems with visualization
보행노인 교통사고가 지역과 발생
수를 보게 되면 제기동 쪽에 조금
교통사고가 일어나고 있음을
있습니다. 하지만 다른 지역도 많은
통사고가 발생되어 어느 지역이 보행
노인 교통사고가 많이 일어난 곳이라고
단정짓기 힘들다.
4. How to solve the problems with visualization
보행어린이로 인한 교통사고 발생
지역과 발생 수를 보게 되면 다양
지역에서 많은 교통사고가
어나고 있음을 있습니다.
4. How to solve the problems with visualization
자전거로 인한 교통사고 발생지역
발생 수를 보게 되면 수많은 지역
에서 많은 교통사고가 일어나고
음을 있고 4가지 사고유형
제일 많은 비중을 차지하고 있음
있습니다.
4. How to solve the problems with visualization
모든 유형을 묶어서 교통사고
생지역을 보게 되면 어떤 지역이
교통사고가 몰려 있은 지역이
거나 특정한 사고유형이 많은
지역이 뚜렷하게 보지 않은
있습니다.
5. 결론
데이터 시각화로 보았던 교통사고 공공데이터와 앞에 제기했던 문제를 활용해 2가지 가설을 세우고 가설이 맞는지 확인해보겠습니다.
1. 교통사고 유형에 상관없이 교통사고가 많이 일어나는 지역이 존재하고, 지역은 교통사고가 일어나기 쉬운 위험지점이 많을 것이
.
2. 노인, 무단횡단, 어린이, 자전거로 분류를 나누어 유형별 교통사고가 많이 일어나는 지역이 있을 것이다.
번째로 교통사고 유형에 상관없이 교통사고가 많이 일어나는 지역이 존재하고, 지역은 교통사고가 일어나기 쉬운 위험지점이 많을
것이라고 생각했지만, 다양한 지역에서 다양한 유형을 교통사고가 일어나고 있음을 있었고 번째로 노인, 무단횡단, 어린이, 자전
거로 분류를 나누어 유형별 교통사고가 많이 일어나는 지역이 있을 것이라고 생각했지만 뚜렷하게 특징을 찾지 못하였습니다. 교통사고는
어느 지역에서든지 안전에 유의하지 않는다면 교통사고는 언제나 일어날 있다는 결론을 내었습니다. 아쉬운 점으로 Mapbox에서 사용
있는 데이터 양이 정해져 있어서 교통사고가 많은 지역을 보기 힘들었습니다.
감사합니다